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Доцільність реалізації оперативно-адаптивного 
стиску зображень та відеоданих 


У статті розглядаються основні методи кодування відеоданих та їх недоліки. Розглядається проблема 
спотворення форми обвідних відеосигналів за рахунок кодування при дослідженні тестових кадрів 
первинних масивів відеоданих. 


Вступ 


За рахунок розповсюдження таких технологій, як ПУЮ)-відео, цифрового телеба- 
чення та потокового відео в мережі Інтернет, вагомим компонентом їх реалізації стала 
компресія відеоданих. Успіх цифрового телебачення та Ю)УГ)-відео базується на тех- 
нології МРЕС-2, який був розроблений 15 років тому. Ця технологія довела свою 
ефективність, проте сьогодні вона є застарілою. На її зміну прийшли нові засоби стис- 
нення даних, такі як МРЕС-4 та Н.264, які показали хороші результати в плані стиску та 
якості відео. Алгоритми, що реалізують ці методи, використовують ту ж саму схему ко- 
дування й декодування, що 1 МРЕС-2, відмінність їх роботи полягає у вдосконаленні 
основних етапів реалізації даної схеми. Проте, як і раніше, ці технології використовують 
стиск із втратами даних, що в результаті так чи інакше якісно впливає на сприйняття 
людиною такого відео | 1). 

Метою даної роботи є обгрунтування основних моментів втрати корисної інфор- 
мації алгоритмом, який реалізований тим чи іншим методом кодування відеоданих, а 
також візуальна та аналітична оцінка якості кодування відеоданих при різних коефі- 
цієнтах стиску. 


Основні принципи стиску відеоданих та їх недоліки 


Для стиснення відеосигналу використовується видалення різного роду збитко- 
востей. Зокрема, статистична збитковість видаляється таким чином, що вихідний сигнал 
може бути повністю відновлений за допомогою декодера практично без втрат даних. 
Проте методи стиску даних без втрат дають досить скромні результати, тому будь-який 
алгоритм стиску відеоданих не обходиться лише цими методами. Окрім видалення ста- 
тистичної збитковості алгоритми відеокомпресії видаляють збитковість з часової, про- 
сторової та частотної областей сигналу. 

Сам відеокодер складається з трьох основних компонент: часової моделі, просто- 
рової моделі та ентропійного кодера. На вхід часової моделі подається нестиснений 
цифровий відеосигнал. Часова модель зменшує часову збитковість, використовуючи 
високий рівень кореляції між послідовними відеокадрами. Зазвичай така модель будує 
прогноз для наступних кадрів на основі сусідніх кадрів послідовності. За рахунок цього 
зменшується час пошуку часових збитковостей. Прогноз формується за одним чи кіль- 
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кома попередніми кадрами, при цьому здійснюється корекція розходження кадрів. Оче- 
видно, що за рахунок похибок округлення при кодуванні та відновленні, а також через 
інші причини, така послідовність залишкових кадрів втрачатиме корисні дані. Тому, за- 
звичай, така модель використовує ключові кадри, які зберігаються повністю. Такі кадри 
вставляються кожні 15 - 20 кадрів для контролю втрати даних. 

На виході часової моделі ми отримуємо залишковий кадр та деяку множину число- 
вих параметрів моделі. Залишковий кадр є входом для просторової моделі, яка викорис- 
товує подібність сусідніх просторових фрагментів даного кадру, усуваючи цим самим 
просторову збитковість. Це реалізується застосуванням ряду перетворень до залишкового 
кадру та квантуванням результату. Застосування перетворень до залишкового кадру пере- 
водить його до іншої області, в якій він набуває форму послідовності коефіцієнтів вико- 
ристовуваного перетворення. Ці коефіцієнти квантуються методом видалення несуттєвих 
значень, в результаті чого залишається невелика кількість суттєвих коефіцієнтів, які 
дають більш компактну форму залишкового кадру. Виходом просторової моделі є мно- 
жина квантованих коефіцієнтів перетворення. 

Параметри часової та просторової моделі стискаються ентропійним кодером. При 
цьому видаляється статистична збитковість. У результаті цього отримуються компактні 
дані, які можна передавати по мережах чи зберігати на цифрових носіях. Відеодекодер 
реконструює відеокадр по стисненому бітовому потоку даних. Коефіцієнти та вектори 
руху декодуються ентропійним декодером, після чого просторова модель декодує отри- 
мані дані і формує частину залишкового кадру. Декодер використовує параметри векторів 
руху разом з одним чи кількома раніше декодованими кадрами для побудови прогнозу 
поточного кадру, а сам кадр реконструюється додаванням залишкового кадру до цього 
кадру-прогнозу. 

Зазвичай різниці між кадрами можуть виникати через рух об'єктів на відео, які не 
міняють свою форму (рух автомобіля, рух людини, панорамне відео, та ін.). Рух таких 
об'єктів на відео зазвичай ініціюють переміщення цілих груп пікселів між кадрами, які в 
цілому утворюють оптичний потік. Якщо точно знати оптичний потік пікселів відео, то 
можна здійснити точний прогноз зміщення більшості пікселів на сусідніх кадрах. Проте 
точне обчислення оптичного потоку не є ефективним через високу складність обчис- 
лень. Тому на практиці широко використовується метод компенсації руху, який компен- 
сує переміщення прямокутних областей. Такий метод включає наступні етапи: 

1. Пошук на попередньому (наступному) кадрі блоку пікселів, для яких можна 
застосувати цей метод. 

2. Отримання залишкового блока. 

3. Кодування залишкового блока 

Даний метод достатньо простий в реалізації. Прямокутні області досить просто впи- 
суються в прямокутний формат кадрів, а також в процедури перетворення зображень на 
основі блоків. Проте реальні об'єкти на відео зазвичай мають неправильну форму, в ре- 
зультаті чого виникають деякі труднощі обробки країв таких об'єктів даним методом. 
Крім того об'єкти часто зміщуються на неціле число пікселів між кадрами, що спричи- 
няє певну втрату даних. Зазвичай ці недоліки спричиняють втрату кореляції між окреми- 
ми такими блоками, що часто добре видно на відео у вигляді блочної структури кадру (1). 


Якість кодування відеоданих 


Оцінка якості відеоданих є дуже складним процесом. Зокрема, характер оцінюван- 
ня залежить від результату, який очікується від відео. Виділяють суб'єктивні та об'єк- 
тивні методи оцінювання якості відеоданих. Візуальне сприйняття відеоданих людиною 
є суб'єктивним від самого початку, оскільки на нього діє ряд факторів, як внутрішніх 
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так і зовнішніх, в залежності від яких відео буде сприйнято людиною по-різному. Тому 
під таким оцінюванням слід вважати якість показу даного відео, а не якість самого відео. 
Для отримання більш точних результатів проводяться статистичні експерименти, де на 
основі вражень від перегляду великої кількості неспокушених глядачів отримується ста- 
тистична інформація. 

До об'єктивних методів оцінки якості відеоданих відносять автоматичні методи 
і алгоритми вимірювання якості. Найбільш популярним методом оцінки якості відео є 
пікове співвідношення сигнал/шум РЗМВ, що оцінює чистоту та достовірність сигналу, 
якості алгоритмів стиску відео, яке призначене не для відеопоказу, а для обробки даних 
іншими спеціалізованими алгоритмами (обробка знімку флюорографії, дані космічних 
знімків, відеоспостереження в охоронних системах тощо.) 

Ми провели об'єктивну оцінку якості кодування відео в форматах МРЕС2 та Н.264 
для різних коефіцієнтів стиску. Для цього ми представили відеодані у вигляді суціль- 
ного потоку пікселів, розкладених на відліки червоного, зеленого і синього кольорів. По- 
тік кожного відліку за рахунок кореляції сусідніх пікселів утворював криву. Таку криву 
відео без стиску ми порівняли шляхом накладання з кривою відео зі стиском різного 
ступеня (рис. 1), в результаті чого отримали, що при кодуванні МРЕС2 та Н.264 навіть 
при незначному збільшенні коефіцієнтів стиску починається втрата корисних даних. 


Рисунок 1 - Порівняння кривих червоного відліку контрольного зразку і перекодованого відео 
(пунктиром - оригінальна крива; суцільною - крива перекодованого відео): а) контрольний 
зразок; б) кадр з середнім коефіцієнтом стиску МРЕС?; в) порівняння відліків кадру б) 

з контрольним зразком; г) кадр з високим коефіцієнтом стиску МРЕС2; д) порівняння відліків 
кадру г) з контрольним зразком; е) кадр з середнім коефіцієнтом стиску Н.264; є) порівняння 
відліків кадру е) з контрольним зразком; ж) кадр з високим коефіцієнтом стиску Н.264; 

з) порівняння відліків кадру ж) з контрольним зразком 
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На такому порівнянні крива перекодованого відео починає відхилятися від тен- 
денції кривої оригінального відео на різких і високих стрибках амплітуди кривої. При- 
чому крива після кодування МРЕС2 набуває шумів технічного походження, а крива 
після кодування Н.264 виглядає більш розгладженою. За рахунок цього при збільшенні 
коефіцієнтів стиску відео, перекодоване за допомогою МРЕСО2, набуває артефактів, які 
спотворюють візуальні дані, а відео, перекодоване за допомогою Н.264, стає більш розми- 
тим, що візуально не помітно, проте таке розмиття спричиняє втрату дрібних деталей (21. 
Саме це робить непридатними такі методи кодування, як МРЕС2 та Н.264, для кодуван- 
ня спеціалізованого відео. Зазвичай на практиці таке відео не стискається, а зберігається 
необробленим, що вимагає великої кількості ресурсів та дорогого обладнання. 


Висновки 


Сам факт використання ключових кадрів свідчить про те, що метод видалення ча- 
сової збитковості може породжувати спотворення відео, 1 чим рідше використовуються 
ключові кадри в потоці, тим більше спотворень набуватиме відео. 

Практично найбільше спотворень спричиняє метод компенсації руху, який ком- 
пенсує рух прямокутних областей. Цей метод використовує компенсацію переміщення 
прямокутних областей пікселів. На практиці зазвичай форми мають неправильну форму, 
тому виникають труднощі при використанні цього методу на краях таких областей. 
Зазвичай існує проблема кореляції таких областей на відновленому кадрі. На кадрі після 
стиску Н.264 грань між такими областями розмивається, проте це спричиняє втрату 
дрібних деталей. Крім того втрату даних спричиняє зміщення блоку на неціле число пік- 
селів. І навіть усереднення сусідніх значень пікселів спричиняє певні втрати інформації. 
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В.И. Бовсуновский 

Целесообразность реализации оперативно-адаптивного сжатия изображений и видеоданньтх 

В статье рассматриваются основньве методьт кодирования видеоданньгх и их недостатки. Рассматриваєтся 
проблема искажения формьт обводящих видеосигналов за счет кодирования при исследований тестовьіх 
кадров первичньх массивов видеоданньтх. 
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